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摘要 : AES (Rhododendron capitatum) 和 陇 蜀 杜 鹏 CR. przewalskii) 是 极 具 观赏 价值 的 
野生 花卉 和 药 用 植物 。 为 探讨 头 花 杜 鹏 和 陇 蜀 村 人 鹏 叶绿体 基因 组 的 遗传 结构 及 进化 特征 ,该 
研究 利用 Ilumina HiSeq 4000 平台 对 头 花 杜 鹏 和 陇 蜀 杜 鹏 的 叶绿体 全 基因 组 进行 测序 ， 经 
组 装 和 注释 后 ， 结 合 7 个 已 发 表 的 杜 鹏 属 植 物 叶 绿 体 全 基因 组 进行 比较 基因 组 学 分 析 和 系 
统 发 育 分 析 。 结 果 表 明 : C1) 头 花 杜鹃 和 陇 罚 杜 鹏 叶绿体 全 基因 组 旦 典型 的 环 状 四 分 体 结 
构 ， 均 由 一 个 大 单 拷贝 区 (105 990、109 191 bp) 、 一 个 小 单 拷贝 区 (2 617、2 606 bp). 和 
一 对 反问 重复 区 (45825. 47516 bp) 构成 ， 全 长 分 别 为 200 257、206 829 bp。 (2) AE 
FERE RIDE S] FE BS TH E DSL AH B HER EHE 263 个 SSR 位 点 ,大 部 分 SSR 偏好 使 用 AT f 
基 ; 密码 子 偏好 使 用 A/U 结尾 。(3) 杜鹃 属 植物 叶绿体 全 基因 组 中 普遍 存在 基因 丢失 以 
及 基因 组 重 排 等 结构 变异 现象 。 该 研究 丰富 了 杜 鹏 属 植 物 的 基因 组 资源 ,为 头 花 杜鹃 、 陇 者 
杜 鹏 的 育种 、 遗 传 进化 及 系统 发 育 等 相关 研究 提供 了 理论 基础 。 
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Comparative analysis of the chloroplast genomes of Rhododendron 
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Abstract: Rhododendron capitatum and R. przewalskii are ornamental flowers and medicinal 
plants. The chloroplast genomes of R. capitatum and R. przewalskii have been sequenced using 
Illumina HiSeq 4000 platform to explore the evolution features and genetic structure. After 
assembly and annotation, the chloroplast genome structure of R. capitatum and R. przewalskii 
were analyzed and compared with that of other Rhododendron plants. The results were as follows: 
(1) The chloroplast genomes of R. capitatum and R. przewalskii exhibit a typical quadripartite 
structure, including a large single copy region (105 990, 109 191 bp), a small single copy region 
(2 617, 2 606 bp), and a pair of inverted repeat regions (45 825, 47 516 bp). And the two 
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Rhododendron chloroplast genomes were 200 257 and 206 829 bp in length, respectively. (2) In 
addition, the 263 SSRs were detected in the chloroplast genome of R. capitatum and R. 
przewalskii, most of which had A/T base preference; the codons preferred ending in A/U. (3) The 
chloroplast genomes of Rhododendron species exhibit structure variation such as gene loss and 
genomic rearrangement. Our study enriches the genomic resources of Rhododendron plants and 
provides the theoretical basis for resource exploitation, genetic evolution, breeding, and phylogeny 
of R. capitatum and R. przewalskii. 

Keywords: Rhododendron capitatum, R. przewalskii, Rhododendron L., chloroplast genome, 


sequence characteristics, structural mutation 


#LI 55 (Rhododendron L.) ###LI 5757 (Ericaceae) 中 最 大 的 属 ， 也 是 多 样 性 最 为 丰富 
的 一 个 属 ， 全 球 共 有 1000 余 种 ， 我 国 约 571 种 ， 集 中 产 于 西南 、 华 南 地 区 eS, 
1999) 。 杜 鹏 属 植物 种 类 繁多 ， 花 型 优美 且 色 泽 艳 丽 ， 是 国际 知名 花卉 ， 也 是 我 国 传统 十 大 
名 花 之 一 ， 素 有 “ 木 本 花卉 之 王 ”、“ 花 中 西施 ”的 美誉 〈 李 云 飞 等 ，2019) 。 中 国 是 世界 
上 拥有 野生 杜 鹏 花 资 源 最 丰富 的 国家 , 得 天 独 厚 的 资源 优势 为 我 国 发 展 杜 鹏 花卉 产业 和 开展 
杜 驶 花 品种 研究 提供 有 利 条 件 , 但 对 于 杜鹃 属 植 物 的 的 引种 驯化 、 育 种 和 开发 利用 的 研究 工 
作 却 远 远 的 落后 于 其 他 园林 发 达 的 国家 和 地 区 〈 程 淑 媛 ，2017; 庄 平 ，2019) 。 一 方面 ， 杜 
鹏 属 植物 属于 快速 的 辐射 分 化 CMilne et al., 2010) 以 及 频繁 的 种 间 杂 交 (Ma et al., 2016) 
的 繁衍 方式 ,因此 形成 多 种 变异 和 种 间 杂 交 类 型 , 给 野生 杜鹃 属 植物 的 种 质 资 源 分 类 鉴定 带 
来 困难 ; 男 一 方面 ， 我 国 杜 鹏 花 育 种 起 步 较 晚 ， 基 础 薄弱 ( 耿 兴 敏 等 ，2021) ， 在 很 大 程度 
上 制约 了 杜 鹏 花 新 品种 的 选 育 及 资源 挖 气 利用 的 进程 。 

头 花 杜 鹏 (Rhododendron capitatum) 7E A TEBS CR. przewalskii) 均 为 杜鹃 属 有 较 
高 药 用 价值 和 观赏 价值 的 常 绿 灌木 。 头 花 杜鹃 和 陇 罚 杜 鹏 常 以 叶 、 花 入 药 , 用 于 治疗 培根 病 、 
龙 病 等 ， 是 藏族 地 区 特有 的 民族 特色 习 用 药材 (青海 省 药品 检验 所 和 青海 省 藏医 药 研究 所 ， 
1096; 27, 2018) ; 且 这 两 种 植物 树 形 优美 、 花 色 艳 丽 ， 花 期 长 ， 加 上 其 耐寒 、 耐 旱 、 
适应 性 强 等 方面 的 优点 ， 可 作为 优良 的 灌木 类 观 花 植物 育种 的 亲本 材料 〈 曹 文 侠 ，2001; 李 
永 金 ，2011) ， 因 而 极 具 园林 观赏 价值 和 良好 的 产业 化 前 景 。 目 前 ， 对 这 两 种 杜 鹏 的 研究 主 
要 集中 在 功能 性 状 ( 何 家 莉 等 ，2021; Yang etal., 2021) 、 化 学 成 分 (Liao et al., 2017; Bai et 
al., 2019) 、 生 态 适 应 性 〈 张 德 是 等，2003; 曹 晓 娟 等 ，2009) 等 方面 的 研究 ， 而 关于 其 遗 
传 背 景 的 研究 尚 少 ,明确 其 遗传 背景 将 为 掌握 及 有 效 利用 优异 性 状 基因 资源 ,进而 通过 分 子 
遗传 学 育种 方法 对 这 两 种 杜 鹏 属 植物 进行 种 质 创 新 和 品种 改良 具有 重要 意义 。 

叶绿体 起 源 于 细胞 内 共生 的 蓝藻 ,是 植物 细胞 进行 光合 作用 的 细胞 器 , 参与 植物 的 生长 
发 育 ， 在 植物 漫长 的 演化 过 程 中 发 挥 着 至 关 重 要 的 作用 (Daniell et al., 20160 。 高 等 植物 叶 
绿 体 基 因 组 一 般 为 一 个 长 度 为 120—160 kb 的 双 链 环 状 分 子 ， 由 一 个 大 单 拷贝 区 Clarge 
single copy, LSC) | (81—90 kb) 、 一 个 小 单 找 贝 区 (small single copy, SSC) (18—20 kb) 
及 一 对 完全 相同 的 反问 重复 区 Cinverted repeats, IRs) (20—30 kb) 组 成 (Jansen et al., 2005). 
大 部 分 高 等 植物 叶绿体 基因 组 为 母系 遗传 , 结构 保守 ,包含 大 量 的 遗传 信息 ， 是 植物 遗传 改 
良 转化 、 遗 传 多 样 性 分 析 、 适 应 性 进化 、 分 子 育种 研究 的 惯用 信息 来 源 ， 为 经 济 作物 改良 、 
园艺 品种 选 育 、 濒危 物种 保育 提供 了 分 子 基础 (Gu etal., 2019; EZF, 2021; Zhang et al., 
2022) 。 此 外 ， 前 人 采用 了 DNA 条 形 码 技术 (Yan et al., 2015; ABBES, 2019). Æ 
因 组 测序 技术 〈 李 云 飞 等 ，2019; 黄 承 玲 等 ，2020) 、 基 因 组 浅 层 测序 技术 (Fu et al., 2022) 
等 基因 组 片段 对 杜 鹏 属 植 物 的 系统 发 育 关 系 进行 了 探索 , 基本 能 辨 清 其 亲缘 关系 , 但 现 有 对 
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杜 鹏 属 的 分 类 研究 大 多 仅 限 于 属 、 亚 属 或 组 等 分 类 阶 元 ， 对 于 物种 、 亚 组 、 甚 至 组 间 的 鉴别 
能 力 仍 较 弱 。 叶 绿 体 基 因 组 序列 分 子 数 小 , 进化 速率 适中 , 长 度 是 普通 条 形 码 序列 的 几 百 倍 ， 
包含 了 更 多 的 遗传 信息 ， 具 有 更 强 的 分 辨 率 ， 可 以 作为 DNA 超级 条 形 码 对 植物 物种 进行 准 
确 的 鉴别 (Kane et al., 2012; Xie et al., 2019) 。 
本 研究 以 头 花 杜 鹏 和 陇 蜀 杜 骼 为 研究 材料 , 在 对 其 进行 测序 、 组 装 和 注释 的 基础 上 ,全 
面 解析 其 序列 与 结构 特征 ， 并 结合 已 发 表 的 7 个 杜 鹏 属 植物 叶绿体 基因 组 序列 进行 比较 分 
析 。 拟 探讨 以 下 科学 问题 : G) 头 花 杜 鹏 、 陇 蜀 杜 鹏 叶绿体 基因 组 序列 有 什么 特征 ? (2) 
杜 鹏 属 植 物 叶 绿 体 基 因 组 有 什么 进化 特征 ? (3) 杜 鹏 属 植物 叶绿体 基因 组 的 变异 模式 及 产 
生 的 原因 是 什么 ? 本 研究 将 进一步 为 头 花 杜 鹏 、 陇 蜀 杜 鹏 及 杜 鹏 属 植物 的 遗传 育种 、 物 种 鉴 
别 及 资源 开发 利用 等 研究 提供 遗传 资源 。 


1 材料 与 方法 


1.1 植物 材料 

ug KERST 2021 年 9 月 6 日 采 自 青海 省 海 东 市 互助 县 〈37?00'16.11" N, 
e 102°15'90.11" E) ， 陇 蜀 杜鹃 于 2021 年 8 月 11 日 采 自 青海 省 海北 藏族 自治 州 门 源 县 
= (37°25'19.25" N, 101°80'12.39" E) , 采集 时 选取 健康 植株 的 新 鲜嫩 叶 放 入 硅胶 中 干燥 保存 ， 
=> 用 于 DNA 提取 ， 同 时 采集 带 花 果 的 植株 用 于 后 期 的 形态 鉴定 。 所 有 凭证 标本 由 青海 省 中 
ლ 医院 赵 国 福 副 主任 药师 鉴定 ， 并 存放 于 青海 省 中 医院 标本 馆 〈( 采 集 号 : 头 花 杜 鹏 : 
L 632126LV0192, Mწ9)#LI9: 632126LY0128) . 
1.2 方法 
1.2.4. 总 基因 组 DNA 提取 与 测序 

总 DNA 的 提取 采用 百 泰克 植物 基因 组 快速 提取 试剂 盒 (Plant Genomic DNA Kit, 
Beijing) 进行，NanoDrop 2000 (Thermo Fisher Scientific, USA) 检测 DNA 纯度 ，Quantus 
Fluorometer (Picogreen) 检测 DNA 浓度 ， 琼 脂 糖 凝 胶 电 泳 检测 DNA 完整 性 。 接 着 进行 
p DNA 文库 构建 ,并 利用 Humina HiSeq 4000 平台 进行 测序 。 原 始 数据 (raw reads) 在 NGS 
QC ToolKit (Patel & Jain, 2012) 中 进行 过 滤 ， 去 除 其 中 的 低 质 量 区 后 得 到 待 组 装 序列 〈clean 
reads) 。 
1.2.2 叶绿体 基因 组 的 组 装 、 注 释 以 及 物理 图 谱 的 构建 

以 阔 柄 杜 静 的 叶绿体 全 基因 组 序列 “NC_053746) 为 参考 序列 ， 将 过 滤 后 的 clean reads 
在 GetOrganelle 软件 包 (Jin et al., 2020) 中 进行 组 装 。 组 装 完成 的 叶绿体 全 基因 组 序列 利 
用 CPGAVAS2 软件 (Shi etal., 2019) 进行 注释 ， 并 在 Geneious Prime 软件 (Drummond, 
2012) 中 以 阔 柄 杜 鹏 CR. platypodum, NC 053746) ~ JELAS CR. concinnum, MT239366) 
叶绿体 全 基因 组 为 参考 校正 注释 结果 。 将 叶绿体 基因 组 序列 导入 OrganellarGenomeDRAW 
软件 〈Greiner et al., 2019) 中 ， 进 行 物理 图 谱 的 绘制 。 最 后 ， 通 过 Geneious Prime 软件 将 
检查 无 误 的 头 花 杜 鹏 、 陇 蜀 杜 鹏 叶绿体 全 基因 组 序列 上 传 至 GenBank 数据 库 。 
1.2.3 基本 特征 分 析 

使 用 MISA 在 线 工 具 (Beier et al., 2017) 对 头 花 杜 鹏 、 陇 蜀 杜 鹏 叶绿体 基因 组 中 的 简 
单 重复 序列 (simple sequence repeat, SSR) HTW, FIZER (mono-nucleotide ) SSR, 
二 核 音 酸 (di-nucleotide) SSR, ZER Ctri-nucleotide) SSR, WIZER (tetra-nucleotide) 
SSR, TEE? Cpenta-nucleotide) SSR 和 六 核 苷 酸 (hexa-nucleotide) SSR 的 最 小 重复 值 分 
别 设置 为 10、5、4、3、3 和 3。 


对 9 A-FEBS JS ე Eg HS DSL 2H HH RI REL A RAE XIV 410125, RER 2§ XI UL IKE 
小 于 300 bp 的 基因 ， 获 得 符合 条 件 的 编码 蛋白 质 的 基因 序列 ， 接 着 使 用 MEGA X 软件 
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(Kumar et al., 2018) X XERE KENA 
应 氨基 酸 的 密码 子 使 用 偏好 。 


WERS CNC 053746) 的 叶绿体 基因 组 作为 参考 序列 ， 使 用 mVISTA 在 线 工具 


| 进行 密码 子 使 用 偏好 性 分 析 ， 以 反映 编码 相 


(Mayor et al., 2000) 的 shufffle-LAGAN 模式 (Brudno et al., 2003) 对 9 个 杜鹃 属 物种 叶 


绿 体 基 因 组 序列 进行 分 析 。 
1.2.4 系统 发 育 分 析 


为 了 明确 头 花 杜 鹏 和 陇 罚 杜 鹏 在 杜鹃 属 中 的 系统 发 育 位 置 , 本 研究 选取 17 条 叶绿体 基 
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II2 RF ZRET RARA IM ე 8 + % T AST PEU x I AHERE BS RU DE 38) FE 5 THER PIS IX 4H FF 
列 外 ,其 余 的 15 条 均 下 载 自 NCBI, 包括 : 7 条 杜 鹏 属 植物 序列 , 3 条 白 珠 树 属 (Gaultheria 


Kalm ex Linn.) 植物 序列 ，3 ERIE (Vaccinium Linn. 


) 植物 序列 ， 并 以 1 条 鹿 蹄 草 属 


(Pyrola Linn.) 植物 序列 和 1 条 喜 冬 草 属 CChimaphila Pursh) 植物 序列 为 外 类 群 。 将 以 上 


17 条 叶绿体 全 基因 组 导入 MAFFT v.7 软 


F (Katoh & Standley, 2013) 中 进行 比 对 ， 比 对 的 


结果 在 ModelFinder 软件 (Rozas et al., 2017) 中 计算 最 佳 拟 合 的 核 苷 酸 蔡 代 模 型 和 相应 参 
数 。 分 别 以 最 大 似 然 法 (maximum likelihood, ML) 和 贝 叶 斯 法 (Bayesian inference, BI) X 
行 系统 发 育 分 析 。ML WE RAxML v8.2.4 软件 〈Stamatakis, 2014) 中 构建 ， 参 数 设置 为 
Models = GTR + GAMMA, Bootstrap = 1 000; BI 树 在 MrBayes v3.2.6 软件 (Huelsenbeck & 
Ronquist 2001) 中 构建 ， 参 数 设 置 为 Models = GTR + GAMMA Generations = 2 000 000, 


Sampling Freq = 1 000，Burnin Fraction = 0.25. 
2 结果 与 分 析 


2.1 叶绿体 基因 组 基本 特征 


头 花 杜 鹏 与 陇 蜀 杜 艇 叶绿体 基因 组 序列 均 为 环 式 双 链 分 子 ， 呈 经 典 的 四 段 式 结构 , 包括 


个 大 单 找 贝 区 (LSC) 、 一 个 小 单 拷贝 区 〈SSC) 以 及 两 个 反 向 重复 区 AR) (图 1). 
头 花 杜 鹏 叶绿体 基因 组 (GenBank 登录 号 : OL804295) 全 长 200257bp，LSC X. SSC 区 


以 及 两 个 R 区 长 度 分 别 为 105 990、2 617、45 825 bp: 


陇 唱 杜 鹏 叶绿体 基因 组 (GenBank 


登录 号 : OL871190) 全 长 206 829 bp, LSC 区 、SSC 区 以 及 两 个 R 区 长 度 分 别 为 109 191、 


2606. 47 516 bp. 3L4ETEBS FERS AN DE 33 FE BS AI PH Ee Ak 
35.7%, IR 区 的 GC & Œ (36.696. 36.594) 均 高 于 LSC 


VII 


因 组 总 GC 含量 分 别 为 35.895 
[X GIH 35.4%、35.1%) 及 SSC 


区 (29.8%、30.0%) . 9 个 杜 骼 花 属 植物 的 叶绿体 基因 组 长 度 范围 为 193 798~208 015 bp, 


其 中 最 大 的 是 灵 宝 杜 鹏 , 最 小 的 是 马 织 杜 鹏 ( 原 变 种 ) ; LSC 区 长 度 范围 为 105 990-110 593 


bp, SSC 区 长 度 范围 为 26~2 621 ხი, IR 区 长 度 范围 为 
35.7%~36.0%， 差 异 不 大 ( 表 1) 。 


40 583-47 516 bp; 总 GC REA 
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头 花 杜 鹏 R. capitatum 
200 257 bp 


HERS R. przewalskii 
206 829 bp 


秀 雅 杜 鹏 R. concinnum 
207 236 bp 


T ARPER URAP) R. delavayi var. delavayi 
193 798 bp 


朱红 大 杜 胸 R. griersonianum 
206 467 bp 


灵 宝 杜 胸 R. henanense subsp. lingbaoense 
208 015 bp 


照 山 白 R. micranthum 
207 233 bp 


P R. molle 
197 877 bp 


VE FEBS R. platypodum 
201 047 bp L 


თით 
თირის 


光 系统 1 基因 Photosystem I RNAJE (fii RNA polymerase clpP. matK3&|H clpP, matK gene 

3 3S II 3ETH Photosystem II AR HC EISSU) Ribosomal proteins (SSU) 其 他 基因 Other genes 

细胞 色素 b/f 复合 物 基因 Cytochrome b/f complex 核糖 体 蛋白 (LSU) Ribosomal proteins (LSU) 假设 的 叶绿体 阅读 框 (vof) Hypothetical chloroplast reading frames (vc) 
ATP 合 成 酶 ATP synthase 转运 RNA Transfer RNAs Sri ითი of replication 


INADHB 4f NADH dehydrogenase. KRHERNA Ribosomal RNAs 
RANG HERE RI (ERE 3E RubisCO large subunit 


1 REESE 9 种 植物 叶绿体 全 基因 组 物理 图 谱 


Fig.1 Physical maps of complete chloroplast genome in nine Rhododendron species 


录 本 Polycistronic transcripts 


R1 PRSE 9 种 植物 叶绿体 基 


Table 1 Comparison of the general features of the nine Rhododendron chloroplast genomes 


因 组 基本 特征 


物种 序列 号 长 度 Length (bp) 基因 数量 Gene number GC (96) 
Species Accession No. Full LSC SSC IR Gene PCG tRNA rRNA Ful LSC SSC IR 
3LAEREBS R. capitatum OL804295 200257 105990 2617 45825 138 86 44 8 35.8 354 29.8 366 
陇 蜀 杜 鹏 R. przewalskii OL871190 206829 109191 2606 47516 143 89 46 8 35.7 351 300 365 
AS HERES R. concinnum MT239366 207236 110326 2602 47154 138 89 4l 8 359 354 302 366 
LZRMRBS RÆ) R. delavayi var. delavayi NC 047438 193798 109957 2612 40583 123 80 35 8 360 353 298 371 
朱红 大 杜 鹏 R. griersonianum NC 050162 206467 108922 2611 47467 150 95 47 8 35.8 353 300 365 
灵 宝 杜 鹏 R. henanense subsp. lingbaoense MT239363 208015 110593 2606 47408 136 86 42 8 35.8 353 300 366 
照 山 白 R. micranthum MT239365 207233 110376 2621 47118 141 89 44 8 359 354 367 367 
羊蹄 路 R. molle MZ073672 197877 110189 26 43 831 145 91 46 8 360 353 77 369 
WSHREEBS R. platypodum NC 053746 201047 109134 2613 44650 143 93 42 8 359  Á 353 300 36.8 


头 花 杜 鹏 叶绿体 基因 组 编码 138 个 基因 ， 包 括 86 个 蛋白 编码 基因 ，44 个 tRNA 3 
因 及 8 个 rRNA 基因 ; 而 陇 蜀 杜 鹏 叶绿体 基因 组 则 编码 143 个 基因 ,包括 89 个 蛋白 编 
码 基 因 ，46 个 tRNA 基因 及 8 个 rRNA 基因 。 有 目前 已 发 表 的 9 种 杜 鹏 属 植物 叶绿体 基 
因 组 编码 的 基因 从 123 MBAR CAE REO ] 至 150 个 (朱红 大 杜鹃 不 等 ， 和 蛋白 编 
码 基 因 80 个 [ 马 继 杜 鹏 〈 原 变种 ) ] 一 95 A RAKHE) ,tRNA 基因 35 ABES 
( 原 变种 ) ] 一 47 个 (朱红 大 杜鹃 ) , rRNA 基因 均 为 8 个 GE D ， 引 起 差异 的 主要 原 
因 是 ycfl、ycf15、trnR-UCU、trnM-C4U、trnH-GUG、accD、inf4 等 基因 在 部 分 物种 中 
缺失 ( 表 2) 。 


"m 


X2 PRSE 9 种 植物 叶绿体 基因 组 的 基因 


Table 2 Genes in the chloroplast genome of nine Rhododendron species 


(LX 86 基因 名 称 
e Rca Rpr Rco Rde Rer Rhe Rmi Rmo Rpl 
Gene function Gene name 
rpl12 
rpll4 
, /16 
核糖 体 大 亚 基 Ken CEDE NEM 
Large subunit of ribosomal ი D2 
rpl23 
2?” Dn oin ”“  ”ოე(ვ”. სM”ძ”  ” e 
核糖 体 小 亚 基 
Small subunit of ribosomal 


RNA 聚合 酶 
dependent RNA 


erase 


核糖 体 RNA rm5(X2) 


rRNA genes rrn16(X2) 
"——— ს ს“ს“ს“”ო  " n 

trnA-UGC(X2) 
trnC-GCA 
trnD-GUC 
trnF-GAA 
trnG-GCC 
trnG-UCC . . . - 

转运 RNA trnH-GUG · · - - · - - 

tRNA genes trnI-CAU(X2) . ° . - 
trnl-GAU(X2) 。 
trnK-UUU 
trnL-CAA 
trnL-UAA 
trnL-UAG(X2) 
trnM-CAU 。 。 - - 。 - 。 - - 


tünN-GUU(X2) · · · · · · · : " 
trnP-UGG . . · · · · · · · 
trnQ-UUG · · · · · · · · · 
trnR-ACG(X2) · · · · · · . გ 5 
trnR-UCU(X2) = . - - . à ვ ` " 
traS-GCU · · · · · · · · · 
traS-GGA · · . · · · · · · 
traS-UGA · . · · · · · · · 
trnT-GGU · · · · · · · · · 
trnT-UGU . . . · · · · · · 
trnV-GAC(X2) . · · · · · 。 
trnV-UAC 8 > · · · e z s s 
trhnW-CCA . . . · · · · · · 
O———— PIQUE UN GO E MEM M P HP P  რ··” 
psaB 。 。 。 。 。 。 。 。 
psaC(X2) 。 。 。 。 。 。 。 。 。 


HRALA 


II 
2H 


Photosystem I gene psal(X2) წ გ E è è $ 。 。 。 
HAA IER სი ს S MUSEUM ა 
Photosystem II gene . I : i : E : , , 


ndhB . . . . : . . . . 
ndhC . P . $ 2 2 . : è 
ndhD(X2) E - . . . . : . " 
ndhE(X2) . . . . . . . 2 á 
ndhF - = 2 = 3 z : · s 
ndhG(X2) š . . > s. . . . r 
ndhH(X2) · . . T გ i . . . 
ndh1(X2) . . . . . . . 2 s 
ndhJ . . . . . . . . . 


NADH 脱氧 酶 
NADH oxidoreductase 


细胞 色素 bf 复合 物 基 因 。 გ . . š . . . . 
Cytochrome b/f complex gene . . . . . . . . . 


ATP 合成 酶 . . . . . . . . . 
ATP synthase 。 。 。 = 。 。 。 。 。 


Rubisco 大 亚 基 
Large subunit of Rubisco 


乙酰 CoA RMN 
: accD · · E = · = · · 
E Subunit ofacetyl-CoA— ^ —— s 
细胞 色 2 
细胞 色素 C 合成 本 ccsA(X2) . . . 2 . . . . . 
3 c-type cytochrome synthesis gene OO 
yef1(X2) - - - - - - - - . 
开放 阅读 框 yef3 . . . . . . . . . 
Conserved open reading ycfA(X2) 。 。 。 。 。 。 。 。 。 


Jc115 - - d - - - 2 
Hof 表示 包含 该 基因 ，- 表示 缺失 该 基因 。Reca. %7##L 5; Rpr. WAFERS; Reo. 秀 雅 杜 鹏 ; Rde. 572 
FEBESUSAER); Rgr. 朱红 大 杜 鹏 ，Rhe. 灵 宝 杜鹃 ;1 Rmi. 照 山 白 ; Rmo. 


Note: * indicates the presence of the gene; - indicates gene loss. Rea. Rhododendron capitatum; Rea. 


羊蹄 踢 Rpl. I9MI7 LI 5 ა 


Rhododendron capitatum, Rpr. Rhododendron przewalskii, Reo. Rhododendron concinnum; Rde. Rhododendron 
delavayi var. delavayi; Rgr. Rhododendron griersonianum; Rhe. Rhododendron henanense subsp. lingbaoense; 


Rmi. Rhododendron micranthum; Rmo. Rhododendron mole; Rpl. Rhododendron platypodum. 


2.2 简单 重复 序列 分 析 
通过 对 头 花 杜 鹏 和 陇 蜀 杜 鹏 叶绿体 基因 组 序列 进行 MISA 分 析 , 共 检 测 出 263 个 简单 
重复 序列 ，6 PRA HIER SSR TAER SSR ZER SSR, MER SSR, 

KIZER SSR PIER SSR). YEXEAETERS PEMA 130 个 SSR, 其 中 , 74 个 SSR 分 
布 在 大 单 拷贝 区 ，2 个 SR 分 布 在 小 单 拷贝 区 ， 两 个 反 向 重复 区 分 布 共 有 54 个 SSR; 

最 丰富 的 类 型 是 单 核 苷 酸 SSR (S6 个) ， 其 次 是 二 核 昔 酸 SSR (19 个 ) 、 三 核 昔 酸 SSR 
(12 M). MZE SSR (12 TO ~ KBER SSR (1 个 ) ， 未 检测 到 五 核 背 酸 SSR 。 
Tr DEA RERSTERS HAE JUS] 133 个 SSR, A 87 4 SSR 分 布 在 大 单 拷贝 区 ， 3 个 SSR 
分 布 在 小 单 拷贝 区 ， 两 个 反 向 重复 区 分 布 有 43 个 SR; 其 中 包括 71 个 单 核 昔 酸 SSR、 

19 MZE SSR, 25 个 三 核 苷 酸 SSR、16 AUER SSR， 五 核 苷 酸 SSR 和 六 核 
FR SSR 各 一 个 〈 表 3) 。 


表 3 头 花 杜鹃 、 陇 罚 杜 鹏 中 的 简单 重复 序列 


Table 3 Simple sequence repeats of chloroplast genome in Rhododendron capitatum and R. 


ES 


przewalskii 


3EXEREBS R. capitatum WEBS R. przewalskii 


SSR 类 型 基 序 
SSR type Motif "- 比例 NM 比例 
=> Percentage წ Percentage 
Number Number 
(70) (76) 
FIZER A/T 83 96.51 71 100.00 


Mononucleotide C/G 3 3.48 0 0.00 


二 核 苷 酸 TA/TA 0 0.00 17 89.47 


Dinucleotide AT/AT 19 100 2 10.53 
AAG/CTT 10 83.33 0 0.00 
AAT/ATT 2 16.67 0 0.00 
m " AGA/TCT 0 0.00 4 16.00 
—EGTES 
ATA/TAT 0 0.00 1 4.00 
Trinucleotide 
GAA/TTC 0 0.00 16 64.00 
TAA/TTA 0 0.00 2 8.00 
TTC/GAA 0 0.00 2 8.00 
AAAT/ATTT 4 33.33 2 12.50 
AATA/TATT 0 0.00 3 18.75 
AATT/AATT 1 8.33 1 6.25 
AAGA/TCTT 0 0.00 1 6.25 
AGAA/TTCT 0 0.00 2 12.50 
NS AAAC/GTTT 1 8.33 0 0.00 
MIZER 
ATTG/CAAT 0 0.00 1 6.25 
Tetranucleotide 
ATAA/TTAT 0 0.00 3 18.75 
AAAG/ CTTT 4 33.33 0 0.00 
CAAA/TTTG 0 0.00 1 6.25 
AGAT/ATCT 1 8.33 0 0.00 
AATC/ATTG 1 8.33 0 0.00 
TTTC/GAAA 0 0.00 2 12.50 
TIZER 
GTCAT/ATGAC 0 0.00 1 100.00 
Pentanucleotide 
ZER TAAGGG/CCCTTA 0 0.00 1 100.00 
Hexanucleotide AAGGGT/ACCCTT 1 100.00 0 0.00 


2.3 密码 子 使 用 偏好 性 分 析 

为 了 进行 9 种 杜 鹏 属 植物 叶绿体 基因 组 的 密码 子 使 用 偏好 性 分 析 , 共 筛 选 出 436 条 符 
合 条 件 的 蛋白 编码 基因 序列 ， 其 中 头 花 杜 鹏 47 26. WARS 49 26. 77-15 49 条 、 马 
2001 515 RÆ) 44 Z, RARES 54 26. 725475 49 26. 18III II 50 条 、 羊 中 
MI 49 条 和 阔 柄 杜鹃 45 条 。 通过 对 杜鹃 属 植物 叶绿体 基因 组 密码 子 使 用 偏好 性 分 析 , 结果 
显示 , 大 部 分 杜 鹏 属 植 物 叶 绿 体 基因 组 中 , RSCU>1 的 高 频密 码 子 共有 30 个 (AGA、UAA、 
GCU 等 ) ， 其 中 29 个 以 A/U 碱 基 结尾 ， 而 以 G/C 结尾 的 仅 1 个 ， 表 明 杜 鹏 属 植物 叶 
绿 体 密码 子 偏爱 于 以 A/U 结尾 ; RSCU<1 的 密码 子 共 有 32 个 (AGC, CGC, UGA 等 ) ， 
以 GC 结尾 的 有 29 个 ， 以 AU 结尾 的 有 3 个 。 而 头 花 杜鹃 、 照 山 白 和 羊蹄 踢 叶 绿 体 基 
因 组 中 ， 除 UGA 被 偏好 使 用 (RSCU>1) 外 ， 其 余 密 码 子 的 偏好 性 均一 致 。 以 上 结果 分 析 
KH, ARSE 9 个 物种 之 间 密 码 子 的 偏好 性 保持 高 度 的 一 臻 (图 2) 。 
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IAEE R. capitatum 


陀 神 杜 鹏 R. przewalskii 


秀 雅 杜 鹏 R. concinnum 


0 8810) 86 RPH) R. delavayi var. delavayi 


朱红 大 杜 胸 R. griersoniai 


FREM R. henanense subsp. lingbao: 
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图 2 杜 鹏 属 9 种 植物 相对 同 义 密码 子 使 用 度 CRSCUD 


Fig.2 Heatmap analysis of relative synonymous codon usage (RSCU) values among the nine 


Rhododendron species 


2.4 杜 鹏 属 叶绿体 基因 组 比较 

利用 mVISTA 软件 对 杜鹃 属 植 物 9 个 种 叶绿体 基因 组 进行 了 全 序列 比 对 。 结 果 显 示 ， 
杜鹃 属 植物 叶绿体 基因 组 种 间 整 体 上 呈现 较 高 的 保守 性 , 编码 区 比 非 编 码 区 保守 , 反 向 重复 
区 比 两 个 单 拷贝 区 保守 《〈 图 3) 。 在 9 个 杜鹃 属 物种 中 ， 分 化 程度 较 高 的 是 matK-ycf3、 
trnM-CAU-rpoB、 trnT-GGU-accD、 rpoA-psbJ、 trnM-CAU-rrn16、 trnI-CAU-rps16 和 rpsl6-psal 
等 7 个 基因 间隔 区 《图 3) 。 
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Fig.3 Comparison of chloroplast genomes of nine Rhododendron species 
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2.5 系统 发 育 分 析 

基于 17 个 物种 的 叶绿体 全 基因 组 序列 的 系统 发 育 分 析 结 果 显 示 : ML 和 BI 系统 发 
育 树 拓 扑 结构 完全 一 致 ， 所 有 的 分 支 都 具有 较 高 的 支持 率 C852>63%, ნ0=1 。 杜 鹏 属 的 
单 系 性 得 到 强烈 支持 (BS=100%, PP=1), 白 珠 树 属 与 越 桔 属 形成 姊妹 群 (BS=100%, PP=1 )， 
k 同 构成 杜 鹏 属 的 姊妹 群 ， 支 持 率 较 高 (BS=100%，PP=1) 。 在 杜 鹏 内 部 ，9 ARRS JE 
种 聚 为 一 支 ， 常 绿 杜鹃 亚 属 5 个 种 [ 陇 蜀 杜 鹏 、 阔 柄 杜 鹏 、 朱 红 大 杜 鹏 、 马 继 杜 鹏 〈 原 变种 )、 
AXCERTEBS]HEZg— x: (BS-10096, PP-10 ， 杜 鹏 亚 属 3 个 种 ( 秀 雅 杜鹃 、 照 山 白 、 头 花 杜 
ს) 也 聚 在 一 起 ， 但 未 形成 单 系 ; 本 研究 测 得 的 陇 蜀 杜 静 与 阔 柄 杜 鹏 互 为 姐妹 关系 ， 支 持 率 
较 高 (BS=67%, PP=1) ; 陇 卉 杜鹃 与 照 山 白 杀 缘 关 系 相 对 较 近 (BS=100%, PP=1) (图 4)。 


e SFERI Rhododendron przewalskii 


I9IIIIIII-II6. R. platypodum 
朱红 大 杜 鹏 R. griersonianum 
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图 4 基于 17 个 叶绿体 基因 组 以 最 大 似 然 法 和 贝 叶 斯 法 构建 的 系统 发 育 树 
Fig.4 Phylogenetic tree of 17 species using maximum likelihood(ML) and Bayesian inference ( BI) 


methods based on cp genomes 


3 讨论 与 结论 


本 研究 通过 对 头 花 杜 鹏 、 陇 蜀 杜 鹏 叶绿体 全 基因 组 的 特征 分 析 ， 以 及 与 7 个 已 报道 的 
杜 静 属 植物 叶绿体 基因 组 比较 分 析 结 果 表 明 , 杜 鹏 属 植物 叶绿体 基因 组 结构 和 基因 顺序 发 生 
了 显著 变化 。 通 过 与 大 部 分 被 子 植物 叶绿体 基因 组 对 比 发 现 , 杜 鹏 属 植 物 叶 绿 体 基因 组 中 除 
SSC 区 急剧 缩小 外 , 其 余 各 区 均 高 度 延 展 , 特别 是 IR 区 几乎 延展 约 2 倍 , 由 此 推测 IR. 区 
的 扩张 是 导致 杜 鹏 属 植物 叶绿体 基因 组 增 大 的 主要 原因 。 这 种 整个 基因 组 发 生 的 显著 结构 变 
异 的 重 排 现象 也 在 其 他 物种 中 发 现 , WKE Pelargonium X hortorum) 叶 绿 体 基 因 组 的 IR 
区 延展 至 75 kb， 基 因 组 全 长 约 为 200kb (Chumley etal,2006) ,日 本 柳 杉 (Cryptomeria 
japonica) 叶绿体 基因 组 完全 缺失 了 R DX, 其 叶绿体 基因 组 全 长 仅 为 130 kb 左右 (Hirao et 
al., 2008) 。 此 外 ， 杜 鹏 属 植 物 叶绿体 基因 组 GC 含量 (35.7% 一 36.0%) 比 许多 被 子 植物 如 
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BA] (Aconitum L.) 植物 CC) 38.0%) (Meng et al., 2018) 、 五 福 花 科 (Adoxaceae) TH 
MI) CZ 38.3%) (Fan etal., 2018) 低 ， 这 种 低 GC 含量 与 叶绿体 基因 组 结构 重 排 数量 的 增 
加 有 关 (Wicke et al., 2016) 。 目 前 叶绿体 基因 组 重 排 的 机 制 还 不 清楚 ， 有 研究 推断 ， 叶 绿 
本 基因 组 重 排 可 能 与 叶绿体 基因 组 的 遗传 方式 有 关 〈Zhang et al., 2003; E3255, 2011) 。 
杜 鹏 属 植 物 县 有 典型 的 自然 杂交 现象 , 当 两 个 遗传 背景 差异 较 大 的 个 体 产 生 可 育 杂 交 后 代 时 ， 
基因 组 发 生 了 重组 与 整合 ， 或 许 是 该 属 植物 叶绿体 基因 组 结构 发 生变 异 的 原因 。 
杜鹃 属 植物 叶绿体 基因 组 的 结构 变异 导致 了 基因 复制 和 缺失 事件 ,在 大 部 分 被 子 植物 中 
yfl 基因 具有 2 个 拷贝 ,位 于 IRa-SSC 边界 的 为 完整 基因 ,位 于 IRb-SSC 边界 的 yfl 基 
因 则 被 截断 ， 成 为 一 个 假 基因 ， 除 阔 柄 杜 鹏 外 的 S 种 杜 鹏 属 植物 叶绿体 基因 组 均 完 全 缺失 
了 yc 基因 ， 结 合 该 属 植物 叶绿体 基因 组 特征 推 新 ， 不 同 物种 出 现 不 同类 型 的 基因 缺失 或 
复制 与 IR. 区 的 扩张 或 收缩 的 程度 差异 有 关 。 此 外 ， 对 于 tRNA 来 说 ， 某 一 基因 拷贝 的 缺 
失 ， 有 其 他 拷贝 可 以 作为 补充 ， 不 影响 功能 的 执行 ， 对 和 蛋白 编码 基因 来 说 ， 则 需要 核 基 因 的 
编码 产物 转运 至 也 叶绿体 补充 相应 的 功能 ( 李 岩 等 ， 2017) ， 如 秀 雅 杜鹃 、 马 继 杜 鹏 ( 原 变 
TR) 等 叶绿体 基因 组 缺失 了 inf4 基因 ， 或许 是 该 基因 从 叶绿体 基因 组 转移 到 了 细胞 核 中 并 
进行 转录 ， 随 后 再 将 编码 的 重 白 转运 回 叶 绿 体 参 与 生命 活动 (Sugiura et al., 2003; Lee et al., 
20060 。 与 基因 缺失 相反 ，pdpF 等 基因 由 SSC 区 转移 至 IR 区 时 出 现 基 因 复 制 的 情况 。 
叶绿体 NADH 脱氧 酶 复合 物体 参与 光合 循环 电子 传递 和 叶绿体 呼吸 等 过 程 ， 突 变 率 高 ， 对 
环境 条 件 和 胁迫 敏感 (Peng et al., 2011; Silva et al., 2016) ， 杜 鹏 属 植 物 大 多 地 处 严寒 低 氧 的 
高 原 地 带 ， 这 意味 着 ndhF 等 基因 的 复制 可 能 与 物种 的 环境 适应 性 有 关 。 总 之 ， 叶 绿 体 基 
因 组 结构 重 排 通常 也 伴随 着 部 分 基因 的 缺失 或 复制 , 这 种 现象 是 比较 常见 的 , 而 杜 鹏 属 不 同 
物种 间 基 因 缺 失 的 情况 差异 较 大 ， 说 明了 杜鹃 属 植 物 叶 绿 体 基 因 组 具有 较 高 的 突变 性 。 
密码 子 偏好 性 是 指 在 DNA 在 编码 过 程 中 的 各 同 义 密码 子 非 均 衡 使 用 的 现象 (Sharp & 
Cowe, 1991) 。 这 是 物种 或 基因 长 期 进化 和 自然 环境 适应 性 的 结果 ， 这 种 偏好 性 出 现在 不 同 
物种 之 间 ， 不 同 基因 组 、 以 及 不 同 基因 中 (Li et al., 2019) 。 密 码 子 使 用 偏好 性 是 基因 组 中 
一 个 重要 的 演化 特征 , 对 基因 表达 和 生物 体 进化 具有 重要 意义 。 本 研究 利用 生物 信息 学 统计 
了 已 发 表 的 杜 鹏 属 植物 叶绿体 的 密码 子 使 用 频率 ,筛选 出 了 其 偏好 使 用 的 密码 子 ， 从 而 为 提 
高 外 源 基 因 的 表达 效率 、 转 基因 研究 ， 以 及 改良 育种 提供 参考 
c 叶绿体 基因 组 中 的 SSR 具有 丰富 的 多 态 性 位 点 ， 易 复制 、 遗 传 信息 含量 高 等 优点 而 被 
© 广泛 的 应 用 于 物种 遗传 多 样 性 、 分 子 辅助 育种 和 亲缘 关系 鉴定 等 领域 (Ping et al., 2021; Tang 
etal,2021) 。 本 研究 在 头 花 杜 觅 和 陇 蜀 杜 鹏 2 个 叶绿体 基因 组 中 发 现 ，SSR 类 型 以 单 核 
ER SSR XE, 其 次 为 二 核 背 酸 SSR MZE SSR, 且 基 序 长 度 越 长 , 对 应 的 SSR 越 
少 。 几 乎 所 有 的 SSR 的 重复 单元 主要 由 AMT 碱 基 组 合 构成 ， 说 明 叶 绿 体 基因 组 序列 中 
的 SSR 的 基 序 类 型 以 多 聚 的 AT 为 主 ， 在 其 他 被 子 植物 中 也 有 这 种 现象 存在 〈Yi etal., 
2013) 。 这 些 SSR 可 以 为 杜 鹏 属 植物 品种 选 育 、 遗 传 多 样 性 等 研究 提供 候选 分 子 标记 。 
杜鹃 属 是 分 类 学 研究 中 较为 特殊 和 困难 的 一 个 类 群 。 本 研究 基于 叶绿体 基因 组 构建 的 杜 
鹏 属 系统 进化 树 分 辨 率 较 好 , 支持 杜 鹏 属 的 单 系 性 ， 且 常 绿 杜 鹏 亚 属 与 其 他 亚 属 可 以 完全 分 
JF. 表明 叶绿体 基因 组 用 于 解决 杜 鹏 属 物种 的 鉴定 和 系统 发 育 关 系 的 问题 是 非常 有 效 的 , 但 
杜 鹏 属 植 物种 类 繁多 , 还 需要 更 多 的 杜鹃 属 物种 叶绿体 基因 组 序列 的 公布 , 才能 得 到 更 合乎 
实际 的 进化 谱系 。 
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